Световни новини без цензура!

Четири извода за надпреварата за натрупване на данни за ИИ.

Снимка: nytimes.com

New York Times | 2024-04-06 | 12:13:35

Четири извода за надпреварата за натрупване на данни за ИИ.

Онлайн данните от дълго време са скъпа стока. Години наред Meta и Гугъл употребяват данни за ориентиране на своите онлайн реклами. Netflix и Spotify го употребяват, с цел да предлагат повече филми и музика. Политическите претенденти се обърнаха към данните, с цел да научат към кои групи гласоподаватели да насочат вниманието си.

През последните 18 месеца става все по-ясно, че цифровите данни също са от решаващо значение в развиването на изкуствения разсъдък. Ето какво би трябвало да знаете.

Колкото повече данни, толкоз по-добре.

The триумф на A.I. зависи от данните. Това е по този начин, тъй като A.I. моделите стават по-точни и по-човешки с повече данни.

По същия метод, по който ученикът учи, като чете повече книги, есета и друга информация, огромните езикови модели – системите които са в основата на чатботовете — също стават по-точни и по-мощни, в случай че им се подават повече данни.

GPT-3, пуснат през 2020 година, беше подготвен на стотици милиарди „ токени “, които всъщност са думи или елементи от думи. По-нови огромни езикови модели бяха подготвени на повече от три трилиона токена.

Обикновено обхождане

Текст от уеб страници, събиран от 2007 година насам.

Уикипедия

(3 милиарда токена)

Английски език

Страници в Уикипедия.

12

милиард

Книги 1 и Книги 2

OpenAI не е обяснил наличието на тези набори от данни. Смята се, че съдържат текст от милиони оповестени книги.

55 милиарда

410 милиарда токена

WebText2

Уеб страници, свързани от Reddit, които са получили три или повече гласа „ за “ – индикация за утвърждение от потребителите.

19 милиарда

WebText2

19 милиарда

Обикновено обхождане

410 милиарда токена

Книги 2

55 милиарда

Книги 1

12 милиарда

Уикипедия

Обикновено обхождане: Текст от уеб страници, събиран от 2007 година насам.

WebText2

Уеб страници, свързани от Reddit, които са получили три или повече гласа „ за “ – индикация за утвърждение от потребителите.

Книги 1 и Книги 2: OpenAI не е обяснил наличието на тези набори от данни. Смята се, че съдържат текст от милиони оповестени книги.

Уикипедия: страници на Уикипедия на британски език.

Източник: OpenAI

От The New York Times

Източник: nytimes.com

Свързани новини

четири извода извода надпреварата надпреварата натрупване натрупване данни четири извода надпреварата натрупване данни

Коментари

Подобни новини

Алън Грийнспан, председател на Федералния резерв през просперитета и кризата, почина на 100

Алън Грийнспан, председател на Федералния резерв през просперитета и кризата,

„Какво да правя? Да й кажа ли? Как да поправя това?’

„Какво да правя? Да й кажа ли? Как да поправя

Тя е готова да преплува цялото крайбрежие на Калифорния (ако акулите позволят)

Тя е готова да преплува цялото крайбрежие на Калифорния (ако

Очертава се разделение на поколенията за републиканците по отношение на външната политика

Очертава се разделение на поколенията за републиканците по отношение на

Време е за истинската иранска революция

Време е за истинската иранска революция

Последен въпрос за здравето на Тръмп: Какъв е този обрив по врата?

Последен въпрос за здравето на Тръмп: Какъв е този обрив

Част от Белия дом е превърната в развалини. Балната зала на Тръмп ще се издигне на нейно място.

Част от Белия дом е превърната в развалини. Балната зала

Кабелът, използван при смъртоносна катастрофа с фуникулер в Лисабон, не е разрешен за обществен транспорт

Кабелът, използван при смъртоносна катастрофа с фуникулер в Лисабон, не

Изтекло сватбено видео петни твърдолинейния ирански служител

Изтекло сватбено видео петни твърдолинейния ирански служител

Белият дом се бори да запази споразумението за Газа на фона на притесненията относно Нетаняху

Белият дом се бори да запази споразумението за Газа на

Топ новини

40 смъртни случая от удавяне, съобщени във Франция, докато Европа е обхваната от гореща вълна

40 смъртни случая от удавяне, съобщени във Франция, докато Европа

Върховният съд застава на страната на окръг Мичиган в дело за данъчна възбрана

Върховният съд застава на страната на окръг Мичиган в дело

Уиндъм Кларк показа своята твърдост, тъй като шампионът от US Open Лонг Айлънд не искаше

Уиндъм Кларк показа своята твърдост, тъй като шампионът от US

Дарителите са дали на благотворителни организации в САЩ 617 милиарда долара през 2025 г., според доклада на Giving USA

Дарителите са дали на благотворителни организации в САЩ 617 милиарда

The world of extreme pogo is an eye-popping blend of artistry, courage and ‘mystical zest’

The world of extreme pogo is an eye-popping blend of

Премиерът на Литва Инга Ругиниене, правителството се оттегля след промяна на коалицията

Премиерът на Литва Инга Ругиниене, правителството се оттегля след промяна

Гледайте първото по рода си видео на смъртоносен капан с пружина на новооткрит паяк

Гледайте първото по рода си видео на смъртоносен капан с

Наследниците на Армани пренасят визията напред, докато къщата е изправена пред следващата си глава

Наследниците на Армани пренасят визията напред, докато къщата е изправена

Кой е Джагадиш Паланисами? „Заклетият фен“ на CM Vijay от

Кметът на Чикаго беше критикуван за обявяването на „извънредно положение срещу трансфемицида“ — въпреки че е малка част от 200-те убийства в града тази година

Кметът на Чикаго беше критикуван за обявяването на „извънредно положение

Актуални новини

Бивш полицай от Фредериктън, обвинен в лъжесвидетелстване, злоупотреба с доверие

Бивш полицай от Фредериктън, обвинен в лъжесвидетелстване, злоупотреба с доверие

Най-новият самолетоносач на Китай плава през Тайванския пролив

Най-новият самолетоносач на Китай плава през Тайванския пролив

Индийка печели безплатен дом в Дубай в теглене на късмет:

Защо Gen Alpha все още се интересува от „практически“ работни места в епохата на AI

Защо Gen Alpha все още се интересува от „практически“ работни

Вирусната подписка на местния водещ от Айова привлича вниманието заради поразителните прилики със сбогуването на спортния коментатор от Далас

Вирусната подписка на местния водещ от Айова привлича вниманието заради

Дейвид Бекъм празнува Деня на бащата в лондонския пъб без сина си Бруклин, докато семейната вражда бушува

Дейвид Бекъм празнува Деня на бащата в лондонския пъб без

Братя и сестри стават първото дуо брат-сестра, спечелило $75 милиона Lotto Max джакпот с OLG

Братя и сестри стават първото дуо брат-сестра, спечелило $75 милиона

Тръмп печели голяма победа срещу Китай в надпреварата за земни минерали в Африка — какво означава това за бизнеса в САЩ

Тръмп печели голяма победа срещу Китай в надпреварата за земни

Стойността на акциите на SpaceX падна с 600 милиарда долара за 3 дни след първоначалното стартиране

Стойността на акциите на SpaceX падна с 600 милиарда долара

Бюрото за конкуренция разширява разследването на използването на контрол върху собствеността от собственика на Sobeys

Бюрото за конкуренция разширява разследването на използването на контрол върху

Още новини

© Всички права запазени!

Информация

За нас Реклама Поверителност Контакт